📌Какой вектор лучше: Dense vs Multi-vector embeddings
Раньше хватало одного эмбеддинга на документ. Сейчас — этого уже мало. Нужна структура.
📍Dense-векторы (single vector per doc): — быстрые — экономные по памяти — слабо улавливают контекст — «плавают» при сложных запросах 👉 подходят для простого поиска
📍Multi-vector (late interaction): — вектор на каждый токен — сравниваются токены запроса и документа напрямую — лучше качество на сложных задачах — выше требования к хранилищу 👉 баланс между скоростью и точностью
📍Late interaction ≈ золотая середина: — быстрее, чем cross-encoders — точнее, чем dense-векторы
📍Примеры моделей: — ColBERT — для текстов — ColPali — multimodal: текст + PDF как картинки — ColQwen — как ColPali, но на Qwen2 (Apache 2.0, компактнее)
Если вы работаете с PDF-документами (таблицы, графики, изображения) — мультивекторные модели решают большинство проблем без «чaнкинга» и костылей.
📌Какой вектор лучше: Dense vs Multi-vector embeddings
Раньше хватало одного эмбеддинга на документ. Сейчас — этого уже мало. Нужна структура.
📍Dense-векторы (single vector per doc): — быстрые — экономные по памяти — слабо улавливают контекст — «плавают» при сложных запросах 👉 подходят для простого поиска
📍Multi-vector (late interaction): — вектор на каждый токен — сравниваются токены запроса и документа напрямую — лучше качество на сложных задачах — выше требования к хранилищу 👉 баланс между скоростью и точностью
📍Late interaction ≈ золотая середина: — быстрее, чем cross-encoders — точнее, чем dense-векторы
📍Примеры моделей: — ColBERT — для текстов — ColPali — multimodal: текст + PDF как картинки — ColQwen — как ColPali, но на Qwen2 (Apache 2.0, компактнее)
Если вы работаете с PDF-документами (таблицы, графики, изображения) — мультивекторные модели решают большинство проблем без «чaнкинга» и костылей.
Bitcoin is a decentralized digital currency that you can buy, sell and exchange directly, without an intermediary like a bank. Bitcoin’s creator, Satoshi Nakamoto, originally described the need for “an electronic payment system based on cryptographic proof instead of trust.” Each and every Bitcoin transaction that’s ever been made exists on a public ledger accessible to everyone, making transactions hard to reverse and difficult to fake. That’s by design: Core to their decentralized nature, Bitcoins aren’t backed by the government or any issuing institution, and there’s nothing to guarantee their value besides the proof baked in the heart of the system. “The reason why it’s worth money is simply because we, as people, decided it has value—same as gold,” says Anton Mozgovoy, co-founder & CEO of digital financial service company Holyheld.
NEWS: Telegram supports Facetime video calls NOW!
Secure video calling is in high demand. As an alternative to Zoom, many people are using end-to-end encrypted apps such as WhatsApp, FaceTime or Signal to speak to friends and family face-to-face since coronavirus lockdowns started to take place across the world. There’s another option—secure communications app Telegram just added video calling to its feature set, available on both iOS and Android. The new feature is also super secure—like Signal and WhatsApp and unlike Zoom (yet), video calls will be end-to-end encrypted.
Библиотека data scientist’а | Data Science Machine learning анализ данных машинное обучение from kr